Raccomandazioni per chi sta considerando Apache Flink:
Usalo saggiamente, regola i parametri di memoria e il parallelismo con attenzione. Altrimenti finirai per avere pressione inversa o sottoutilizzare le risorse. È necessaria molta ottimizzazione per quanto riguarda il numero di thread e l'assegnazione della memoria. Non sovrascrivere i processori, il che porterà a un eccesso di parallelismo e semplicemente al trasferimento di dati tra i nodi, il che può portare a rallentamenti. È necessario progettare con cautela. Recensione raccolta e ospitata su G2.com.
Quali problemi sta risolvendo Apache Flink e come ti sta beneficiando?
Usiamo Flink sia per lo streaming online che per l'elaborazione batch offline, principalmente per arricchire i dati in arrivo, integrato con Elastic Search per memorizzarli. Facciamo anche aggregazione usando finestre a scorrimento. Usiamo le viste di Flink. Per l'elaborazione batch, le usiamo per apprendere alcune soglie, come le soglie di CPU, memoria, ecc. Distribuito con centinaia di nodi, altamente scalabile. Distribuito in AWS utilizzando container Kubernetes. Usiamo anche l'interfaccia utente di Flink per risolvere problemi di alto livello. Non usiamo SQL sullo streaming. Recensione raccolta e ospitata su G2.com.